A hangalapú személyazonosítási feladat során nagy hatékonysággal alkalmazott technika a mélytanuláson alapuló beszélőbeágyazás. Ezek a módszerek nagy hatékonyságot mutatnak, ám gyerekfelvételeken való hatékonyságuk még nincs kimérve. A hallgató feladata a téma során a a már rendelkezésre álló előtanított modellek kiértékelés gyerekhangokon, valamint a modellek finomhangolása a jobb teljesítmény eléréséért. További információkért keressen minket az Informatika épület B 156-os szobájában, a sztaho.david@vik.bme.hu email címen, vagy Microsoft Teams-en (Sztahó Dávid, sztaho.david@vik.bme.hu).
A technique that has been used with great efficiency in the speaker verification tasks is deep learning-based speaker embedding. These methods have shown high efficiency, but their effectiveness on children's recordings has not yet been measured. The project's task in this topic is to evaluate the available pre-trained models on children's voices and fine-tune the models to achieve better performance. For more information, please contact us in the Informatics building, room B 156, at sztaho.david@vik.bme.hu or Microsoft Teams (Sztahó Dávid, sztaho.david@vik.bme.hu).